35 research outputs found

    TMbarrier: speculative barriers using hardware transactional memory

    Get PDF
    Barrier is a very common synchronization method used in parallel programming. Barriers are used typically to enforce a partial thread execution order, since there may be dependences between code sections before and after the barrier. This work proposes TMbarrier, a new design of a barrier intended to be used in transactional applications. TMbarrier allows threads to continue executing speculatively after the barrier assuming that there are not dependences with safe threads that have not yet reached the barrier. Our design leverages transactional memory (TM) (specifically, the implementation offered by the IBM POWER8 processor) to hold the speculative updates and to detect possible conflicts between speculative and safe threads. Despite the limitations of the best-effort hardware TM implementation present in current processors, experiments show a reduction in wasted time due to synchronization compared to standard barriers.Universidad de Málaga. Campus de Excelencia Internacional Andalucía Tech

    Time series analysis acceleration with advanced vectorization extensions

    Get PDF
    Time series analysis is an important research topic and a key step in monitoring and predicting events in many felds. Recently, the Matrix Profle method, and particularly two of its Euclidean-distance-based implementations—SCRIMP and SCAMP—have become the state-of-the-art approaches in this feld. Those algorithms bring the possibility of obtaining exact motifs and discords from a time series, which can be used to infer events, predict outcomes, detect anomalies and more. While matrix profle is embarrassingly parallelizable, we fnd that auto-vectorization techniques fail to fully exploit the SIMD capabilities of modern CPU architectures. In this paper, we develop custom-vectorized SCRIMP and SCAMP implementations based on AVX2 and AVX-512 extensions, which we combine with multithreading techniques aimed at exploiting the potential of the underneath architectures. Our experimental evaluation, conducted using real data, shows a performance improvement of more than 4× with respect to the auto-vectorization.Funding for open access publishing: Universidad Málaga/CBU

    Ciencias ambientales. Dentro del concepto de proyecto

    Get PDF
    This document is a contribution inside the Curricular Project of Environmental Administration and Public Services of the Universidad Distrital Francisco José of Caldas to the discussion that sustains the necessity that the Environmental Sciences make part of the group of areas recognized by the Government for the grant of qualified registrations and certifications of quality and the Curricular Project of Administration like part of them.In Colombia the Environmental Science doesn't have a space assigned in the academic structure of the Ministry of Education. It is considered that the Environmental Science doesn't have enough supports to have the science statute or of discipline to occupy a place inside the grateful ones for the State. One argues that the Environmental Science is not more than the juxtaposition of different disciplines or of knowledge that generate a great become attached and don't unite new science. However, the Environmental Science as such is an interdisciplinary science / transdisciplinary that has not still finished being developed like it also happenswith some of the sciences preexistentsEste documento es una contribución para el proyecto curricular de Gestión Ambiental y Servicios Públicos de la Universidad Distrital Francisco José de Caldas, y gira entorno a la discusión que sustenta la necesidad de que las Ciencias Ambientales hagan parte del conjunto de áreas reconocidaspor el Gobierno para el otorgamiento de registros calificados y certificaciones de calidad, teniendo en cuenta al proyecto curricular de Gestión como parte de ellas. En Colombia la Ciencia Ambiental no tiene un espacio asignado en la estructura académica del Ministerio de Educación. Es más, se considera que la Ciencia Ambiental no tiene suficientes soportes para revestir el estatuto de ciencia o de disciplina para ocupar un lugar dentro de los reconocidos por el Estado. Se argumenta que la Ciencia Ambiental no es más que la yuxtaposición de diferentes disciplinas o de saberes que generan un gran sumatoria y no una nueva ciencia. Sin embargo, la Ciencia Ambiental como tal es una ciencia interdisciplinaria y transdisciplinaria que aún no ha terminado de desarrollarse como ocurre también con algunas de las ciencias preexistente

    Parallelizing the Sparse Matrix Transposition: Reducing the Programmer Effort Using Transactional Memory

    Get PDF
    AbstractThis work discusses the parallelization of an irregular scientific code, the transposition of a sparse matrix, comparing two multithreaded strategies on a multicore platform: a programmer-optimized parallelization and a semi-automatic parallelization using transactional memory (TM) support. Sparse matrix transposition features an irregular memory access pattern that de- pends on the input matrix, and thereby its dependencies cannot be known before its execution. This situation demands from the parallel programmer an important effort to develop an optimized parallel version of the code. The aim of this paper is to show how TM may help to simplify greatly the work of the programmer in parallelizing the code while obtaining a competitive parallel version in terms of performance. To this end, a TM solution intended to exploit concurrency from sequential programs has been developed by adding a fully distributed transaction commit manager to a well-known STM system. This manager is in charge of ordering transaction commits when required in order to preserve data dependencies

    Irrevocabilidad Relajada para Memoria Transaccional Hardware

    Get PDF
    Los sistemas comerciales que ofrecen memoria transaccional (TM) implementan un sistema hardware best-effort (BE-HTM) con limitaciones. Es necesario programar un fallback software basado en cerrojos para asegurar el progreso de la aplicación. En este artículo se propone un nuevo tipo de irrevocabilidad hardware (un modo transaccional que marca las transacciones como no abortables) para hacer frente a las limitaciones de los sistemas BE-HTM de una manera mas eficiente, y para liberar a al usuario de tener que programar un fallback. Se basa en el concepto de suscripción relajada utilizada o en el contexto de la programación de fallbacks basada o en cerrojos, donde la transacción se suscribe al cerrojo al final de la misma en lugar de al principio. El mecanismo de irrevocabilidad relajada hardware no involucra cambios en el protocolo de coherencia y se compara con su homólogo software, que proponemos como un fallback con suscripción relajada de espera escapada. También proponemos la irrevocabilidad relajada con anticipación, un mecanismo que no se puede implementar en software, y que mejora el rendimiento de las aplicaciones con múltiples reemplazos de bloques transaccionales de caché. La evaluación de las propuestas se lleva a cabo con el simulador Simics/GEMS junto con la suite de benchmarks STAMP, y se obtiene una mejora de rendimiento sobre el fallback del 14% al 28% para algunos benchmarks.Universidad de Málaga. Campus de Excelencia Internacional Andalucía Tech

    Accelerating time series motif discovery in the Intel Xeon Phi KNL processor

    Get PDF
    Presented at HiPEAC Conference 2020, Bologna (Italy)Time series analysis is an important research topic of great interest in many fields. However, the memory-bound nature of the state-of-the-art algorithms limits the execution performance in some processor architectures. We analyze the Matrix Profile algorithm from the performance viewpoint in the context of the Intel Xeon Phi Knights Landing architecture (KNL). The experimental evaluation shows a performance improvement up to 190x with respect to the sequential execution and that the use of the HBM memory improves performance in a factor up to 5x with respect to the DDR4 memory.Universidad de Málaga. Campus de Excelencia Internacional Andalucía Tech

    Mejorando el rendimiento de la memoria transaccional para aplicaciones irregulares

    Get PDF
    La Memoria Transaccional (TM) ofrece un modelo de ejecución concurrente optimista en arquitecturas multinúcleo, permitiendo a los programadores extraer paralelismo cuando la información de las dependencias de datos no está disponible hasta la ejecución ́del programa. Existe investigación reciente enfocada a explotar paralelismo a nivel de hilo usando TM. Sin embargo estas propuestas son de uso general, válidas para cualquier tipo de aplicación. Este trabajo presenta ReduxSTM, un TM software especialmente diseñado para mejorar la extracción de paralelismo en aplicaciones irregulares. La gestión de las versiones y la detección de conflictos se han diseñado para aprovechar tanto la ordenación secuencial de las transacciones, necesaria para asegurar la corrección de los resultados, como la privatización de patrones de reducción, un patrón de acceso a memoria muy frecuente en aplicaciones irregulares. La información adicional que proporcionan estas propiedades en tiempo de ejecución se utiliza para evitar abortos transaccionales innecesarios. Se ha elegido una función del benchmark 300.twolf de la suite SPEC CPU2000 como ejemplo de programa irregular con reducciones. Este código se ha paralelizado mediante TM utilizando ReduxSTM y una versión ordenada de TinySTM. Los resultados muestran que ReduxSTM es capaz de explotar más paralelismo

    Improving Transactional Memory Performance for Irregular Applications

    Get PDF
    Postprint de autor publicado posteriormente con este DOI:http://dx.doi.org/10.1016/j.procs.2015.05.398Transactional memory (TM) offers optimistic concurrency support in modern multicore archi- tectures, helping the programmers to extract parallelism in irregular applications when data dependence information is not available before runtime. In fact, recent research focus on ex- ploiting thread-level parallelism using TM approaches. However, the proposed techniques are of general use, valid for any type of application. This work presents ReduxSTM, a software TM system specially designed to extract maxi- mum parallelism from irregular applications. Commit management and conflict detection are tailored to take advantage of both, sequential transaction ordering to assure correct results, and privatization of reduction patterns, a very frequent memory access pattern in irregular applications. Both techniques are used to avoid unnecessary transaction aborts. A function in 300.twolf package from SPEC CPU2000 was taken as a motivating irregular program. This code was parallelized using ReduxSTM and an ordered version of TinySTM, a state-of-the-art TM system. Experimental evaluation shows that ReduxTM exploits more parallelism from the sequential program and obtains better performance than the other system.Universidad de Málaga. Campus de Excelencia Internacional Andalucía Tech

    CodSim 2.0: Un Laboratorio Virtual para la Enseñanza de las Codificaciones de Datos

    Get PDF
    El laboratorio virtual está disponible en la URL https://www.ac.uma.es/~guille/codsimEste artículo presenta la herramienta CodSim 2.0, un simulador de codificaciones de datos a nivel físico, dirigido a estudiantes de asignaturas de redes de computadores en grados en ingeniería Informática o Electrónica. El simulador se puede ejecutar en un navegador estándar, al estar basado en JavaScript y HTML5, lo que facilita su uso en cualquier laboratorio o dispositivo del estudiante. Con él se pueden ilustrar escenarios de interés en la transmisión de una señal digital usando diferentes codificaciones o modulaciones y características del canal. Se presenta así mismo una experiencia docente de su uso en una asignatura de redes industriales.Campus de Excelencia Internacional Andalucía Tech
    corecore